Natural Language Inference (NLI) or Recognizing Textual Entailment (RTE) aims at predicting the relation between a pair of sentences (premise and hypothesis) as entailment, contradiction or semantic independence. Although deep learning models have shown promising performance for NLI in recent years, they rely on large scale expensive human-annotated datasets. Semi-supervised learning (SSL) is a popular technique for reducing the reliance on human annotation by leveraging unlabeled data for training. However, despite its substantial success on single sentence classification tasks where the challenge in making use of unlabeled data is to assign "good enough" pseudo-labels, for NLI tasks, the nature of unlabeled data is more complex: one of the sentences in the pair (usually the hypothesis) along with the class label are missing from the data and require human annotations, which makes SSL for NLI more challenging. In this paper, we propose a novel way to incorporate unlabeled data in SSL for NLI where we use a conditional language model, BART to generate the hypotheses for the unlabeled sentences (used as premises). Our experiments show that our SSL framework successfully exploits unlabeled data and substantially improves the performance of four NLI datasets in low-resource settings. We release our code at: https://github.com/msadat3/SSL_for_NLI.
translated by 谷歌翻译
Automatic topic classification has been studied extensively to assist managing and indexing scientific documents in a digital collection. With the large number of topics being available in recent years, it has become necessary to arrange them in a hierarchy. Therefore, the automatic classification systems need to be able to classify the documents hierarchically. In addition, each paper is often assigned to more than one relevant topic. For example, a paper can be assigned to several topics in a hierarchy tree. In this paper, we introduce a new dataset for hierarchical multi-label text classification (HMLTC) of scientific papers called SciHTC, which contains 186,160 papers and 1,233 categories from the ACM CCS tree. We establish strong baselines for HMLTC and propose a multi-task learning approach for topic classification with keyword labeling as an auxiliary task. Our best model achieves a Macro-F1 score of 34.57% which shows that this dataset provides significant research opportunities on hierarchical scientific topic classification. We make our dataset and code available on Github.
translated by 谷歌翻译
关键酶生成旨在生成最能描述给定文档的短语(关键程令)。在学术领域中,目前对这项任务的方法是神经方法,并且在很大程度上仅仅用文章的标题和摘要工作。在这项工作中,我们探讨了从语义相似的文章或给定文章的完整文章中额外数据的集成是否有助于神经关键关键关键基本生成模型。我们发现,特别是以文章摘要的形式添加了完整文本的句子,可以显着改善来自标题和摘要的存在或缺席的两种类型的关键效果的生成。在三个广泛的型号上的实验结果以及适合较长文档的最新变压器模型之一,龙绿者编码器 - 解码器(LED)验证了观察。我们还提供了一个新的大型学术数据集Fulltextkp,用于关键斑点生成,我们用于我们的实验。与现有大规模数据集不同,FullTextkp包括与标题和摘要的文章的完整文本。我们将发布源代码以激发拟议想法的研究。
translated by 谷歌翻译
关键级生成是生成短语(关键词)的任务,该任务总结了给定文档的主要主题。生成的kephrass可以从给定文档的文本存在或不存在。虽然目前的关键术后的提取在过去受到了很多关注的时候,但最近只有更强大的重点是在不存在的关键时代的产生上。但是,生成缺席的关键酶非常具有挑战性;即使是最好的方法也只显示了适度的成功程度。在本文中,我们提出了一种叫做关键症辍学(或KPDROP)的方法,以改善缺乏关键酶生成。我们随机删除文件中的关键短脉冲,并在培训期间将它们变为人为缺席的关键。我们广泛地测试了我们的方法,并表明它一直提高关键正版生成中强基线的不存在性能。
translated by 谷歌翻译
诸如自然灾害,全球大流行和社会动荡等危机不断威胁到我们的世界,并以不同的方式影响了全世界的数百万人。了解人们在大规模危机期间表达的情绪有助于告知政策制定者和急救人员有关人口的情绪状态,并为需要这种支持的人提供情感支持。我们介绍了Covidemo,〜3K英语推文标有情感,并在18个月内分布时间。我们的分析揭示了Covid-19造成的情感损失,以及随着时间的推移社会叙事和相关情绪的变化。由危机的时间敏感性和大规模注释努力的成本的激励,我们研究了在Covid-19的感知情绪预测的任务中,大型的预训练的语言模型在跨领域和时间表中的范围很好。我们的分析表明,跨域信息传输发生,但仍然存在很大的差距。我们提出了半监督的学习,作为弥合这一差距的一种方式,使用来自目标域的未标记数据获得了明显更好的性能。
translated by 谷歌翻译
代码转换(CS)是多语言个体所表现出的常见语言现象,在一次对话中,它们倾向于在语言之间交替。 CS是一种复杂的现象,不仅包含语言挑战,而且还包含大量的复杂性,就其在说话者之间的动态行为而言。鉴于产生CS的因素因一个国家而异,并且从一个人到另一个人都不同,因此发现CS是一种依赖说话者的行为,在该行为中,外语被嵌入的频率在说话者之间有所不同。尽管几位研究人员从语言的角度研究了CS行为,但研究仍然缺乏从社会学和心理学角度预测用户CS行为的任务。我们提供了一项经验用户研究,我们研究用户的CS级别和性质特征之间的相关性。我们对双语者进行访谈,并收集有关他们的个人资料的信息,包括他们的人口统计学,个性特征和旅行经验。然后,我们使用机器学习(ML)根据其配置文件来预测用户的CS级别,在此我们确定建模过程中的主要影响因素。我们试验分类和回归任务。我们的结果表明,CS行为受到说话者之间的关系,旅行经验以及神经质和外向性人格特征的影响。
translated by 谷歌翻译
从视力估算的距离估计对于无数机器人应用,例如导航,操纵和计划是基础。受哺乳动物的视觉系统的启发,凝视着特定物体,我们开发了两个新颖的限制,涉及我们称为$ \ tau $ -constraint和$ \ phi $ -constraint的涉及时间接​​触,加速和距离(移动)相机在仅使用一小部分图像时有效,准确地估算深度。我们通过两个实验成功地验证了所提出的约束。第一个使用单眼摄像机和惯性测量单元(IMU)在轨迹估计任务中应用两个约束。我们的方法的平均轨迹误差降低了30-70%,而运行25美元$ \ times $和6.2 $ \ times $ $ $ \ times $的速度分别比流行的视觉惯性探测方法VINS-MONO和ROVIO。第二个实验表明,当约束用来带有反馈的反馈副本时,所得的闭环系统的特征值是对应用控制信号的缩放的不变性。我们认为这些结果表明$ \ tau $和$ \ phi $约束的潜力是多种机器人应用的强大和有效算法的基础。
translated by 谷歌翻译
多种语言的扬声器倾向于在对话中的语言之间交替,该现象称为“代码切换”(CS)。CS是一种复杂的现象,不仅包括语言挑战,而且在讲话者的动态行为方面也包含大量复杂性。社会学家和心理学家研究了这种动态行为,确定了影响CS的因素。在本文中,我们对阿拉伯语 - 英语CS提供了实证用户研究,在那里我们展示了用户CS频率和字符特征之间的相关性。我们使用机器学习(ML)来验证调查结果,通知和确认现有理论。预测模型能够预测用户的CS频率,精度高于55%,其中旅行经验和人格特征在建模过程中起最大的作用。
translated by 谷歌翻译
识别危机推文中的细粒度位置提到是将从社交媒体提取的情境意识信息转换为可行信息的核心。大多数事先作业都集中在识别通用地点,而不考虑其特定类型。为了促进细粒度的位置识别任务的进步,我们组装了两个推文危机数据集,并用特定的位置类型手动注释它们。第一个数据集包含来自混合危机事件的推文,而第二个数据集包含来自全球Covid-19大流行的推文。我们在域内和交叉域设置中调查在这些数据集上的序列标记的最先进的深度学习模型的性能。
translated by 谷歌翻译
软机器人手的设计和制作仍然是耗时和困难的过程。快速原型的进步在引入设计过程中引入新的复杂性时,显着加速了制造过程。在这项工作中,我们提出了一种采用新型低成本制造技术的方法,与设计工具有助于软手设计人员系统地利用多材料3D打印来制造灵巧的软机器人手。虽然成本和轻量级很低,但我们表明产生的设计是高度耐用的,令人惊讶的强烈,并且能够灵巧地掌握。
translated by 谷歌翻译